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Definicja gry 


Teoria gier i konstruowane na jej podstawie programy 
stanowią jeden z głównych wyznaczników postępu 
sztucznej inteligencji. Głównie ze względów komercyjnych 
spore nakłady przeznaczane są na badania dotyczące 
szachów (np. Intel i IBM zaangażowały w konstrukcję 
komputerów szachowych oraz w badania nad rozwojem 
algorytmów dla gier duże środki). 


Pierwszy program szachowy został napisany w roku 1958 
(Alex Bernstein). 


W roku 1997 Kasparow podczas pojedynku z Deep Blue 
na sześć partii dwie przegrał, trzy zremisował i tylko jedną 
wygrał. 
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Definicja gry 


Definicja gry 


Gra jest to rozgrywka (dowolna sytuacja konfliktowa) 
prowadzona przez graczy, zgodnie z ustalonymi zasadami, 
w celu osiągnięcia określonego celu. 


Gra składa się z zestawu reguł określających możliwości 
wyboru postępowania jednostek (graczy). 


Rozpoczyna się ona od pewnego stanu początkowego 

i kończy się stanem, który według określonego kryterium 
może być uznany za wygrany, przegrany lub remisowy 

(z punktu widzenia jednego z graczy). Z każdym ze stanów 
końcowych można związać pewną funkcję wypłaty. 
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Definicja gry 


Charakterystyczną cechą gry jest istnienie sytuacji 
konfliktowej (konflikt interesów): 


każdy gracz stara się maksymalizować swój własny zysk i 
jednocześnie zminimalizować zysk przeciwnika. 


Podział gier ze względu na liczbę graczy: 


> bezosobowe (np. gra w życie) 

> jednoosobowe (np. puzzle, pasjans) 

> dwuosobowe (np. warcaby, szachy, kółko i krzyżyk) 
> wieloosobowe (np. brydż, poker, chińczyk) 
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Definicja gry 


Podział gier ze względu na liczbę ruchów: 
> jednochodowe (np. papier- kamień-nożyce) 
> wielochodowe (np. szachy, warcaby, brydż) 


Podział gier ze względu na postać funkcji wypłaty: 

> gry o sumie zerowej (wygrana jednego gracza oznacza 
przegraną drugiego gracza) 

> gry o sumie niezerowej 
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Definicja gry 


Podział gier ze względu na posiadaną informację: 

> gry o pełnej informacji (gracz wybierając kolejny ruch 
posiada pełną informację o aktualnej sytuacji oraz 
możliwościach przeciwnika np. warcaby, szachy) 


> gry o niepełnej informacji (np. poker, brydż, domino) 


Podział gier ze względu na występowanie elementu 
losowości: 


> całkowicie losowe (np. ruletka) 
> częściowo losowe (np. brydż, domino, chińczyk) 
> deterministyczne (warcaby, szachy, go) 


Autor: Dariusz Banasiak — Katedra Informatyki Technicznej 6 


Definicja gry 


Każdą z gier można scharakteryzować za pomocą 

przyjętych kryteriów: 

> szachy to gra dwuosobowa, wielochodowa, o sumie 
zerowej, o pełnej informacji i deterministyczna 


> ruletka to gra jednoosobowa, jednochodowa, o sumie 
zerowej, o niepełnej informacji oraz całkowicie losowa 


Celem wykładu jest przedstawienie metod opisu oraz 
poszukiwania strategii dla gier dwuosobowych, wielo- 
chodowych, o sumie zerowej, o pełnej informacji 

i deterministycznych. 
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Wyznaczenie strategii gry 


Proces poszukiwania strategii gry można opisać drzewem. 


Wykonujący pierwszy ruch (ze stanu początkowego) nazywany jest 
graczem, a drugi przeciwnikiem. Określenie funkcji wypłaty dla 
stanów końcowych dokonywane jest z punktu widzenia gracza. 


Korzeń jest początkowym stanem gry, jego potomkowie reprezentują 
stany osiągalne przez gracza w pierwszym ruchu. Z kolei ich potom- 
kowie określają stany możliwe do uzyskania przez przeciwnika itd. 
Węzły końcowe (liście drzewa) reprezentują stany wygrane (wartości 
dodatnie), przegrane (wartości ujemne) lub remisowe (zero) dla gracza. 
Każda droga z węzła początkowego do liścia opisuje jedną rozgrywkę. 


Wyznaczenie strategii gry (planu rozgrywki) polega na 


określeniu kolejnych posunięć gracza dla różnych posunięć 
przeciwnika. 
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Wyznaczenie strategii gry 


Fragment drzewa dla gry „kółko i krzyżyk”: 
Bi 
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Wyznaczenie strategii gry 


Metody określenia strategii wygrywającej dla gracza: 
> na podstawie macierzy gry 
> na podstawie drzewa gry 


Ogólny model gry n-osobowej: 

Niech M = {m}, m», .. , my) oznacza zbiór ruchów 
dopuszczalnych dla danej gry. 

W zbiorze M można wyróżnić n podzbiorów M;, M», .. , M,. 
Zbiór M, jest zbiorem dopuszczalnych ruchów dla gracza G, 
(1= 1, 2, .., п). 

W ogólnym przypadku podzbiory M, nie muszą być 
rozłączne. 
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Wyznaczenie strategii gry 


Przykładowe drzewo dla gry dwuosobowej: 


Се) 
Се) С) 
ry Lo м, 
in in in in in in EZ 
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Wyznaczenie strategii gry 


Dla gracza G,: М, = {i41; 45} 
Dla gracza G: М, = fly, 12) 


Każda partia kończy się po trzech ruchach (gracz G; 
wykonuje dwa ruchy, G, tylko jeden). W każdym posunięciu 
gracz może wybrać jeden z dwóch możliwych ruchów. 


Gracz ОС, posiada cztery różne strategie: 


S4q45 ну 44 Sq25 l1 ho S43= но} Dua ә нә 


Gracz G, posiada dwie różne strategie: 


Dass lo S22= La 
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Wyznaczenie strategii gry 


Na tej podstawie możemy utworzyć macierz gry S: 


152 [52 


EECHER 


Gracz С, dąży do znalezienia takiej strategii, która zapewni 
mu maksymalną wygraną (wartości wypłat ze znakiem +). 


Przeciwnik G, również dąży do znalezienia takiej strategii, 
która zapewni mu maksymalną wygraną (wartości wypłat 
ze znakiem -). 
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Wyznaczenie strategii gry 


Strategia optymalna dla gracza С, zostanie osiągnięta gdy: 
a* = max { min 5, }, 
l J 
gdzie S, — element macierzy 5 (i - indeks wiersza, j- indeks kolumny) 


W tym celu dla każdego wiersza określamy wartość 
minimalną i wybieramy taki wiersz, w którym znalezione 
minimum jest największe: 


Oz äu 
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Wyznaczenie strategii gry 


Strategia optymalna dla gracza С„ zostanie osiągnięta gdy: 
p” = Wi { m Sj b: 


W tym celu dla każdej kolumny określamy wartość 
maksymalną i wybieramy taką kolumnę, w której 
znalezione maksimum jest najmniejsze: 


В = 5 
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Wyznaczenie strategii gry 


Optymalna dla gracza С, strategia o" = S;, nazywa się 
strategią maksyminową (lub maksyminimalną). Zapewnia 
ona graczowi С, wygraną +2 (dolna wygrana). 


Optymalna dla gracza G, strategia B* = S> nazywa się 
strategią minimaksową (lub minimaksymalną). Funkcja 
wypłaty wynosi w tym przypadku +2 (przegrana gracza G»). 
Strategia ta określa górną przegraną gracza G.. 


Jeżeli zachodzi równość: 

o" pg В“ 
to gra posiada punkt siodłowy, a uzyskana w tym 
przypadku funkcja wypłaty nazywa się wartością gry. 
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Wyznaczenie strategii gry 


Gry posiadające punkt siodłowy nazywamy grami o pełnej 
informacji (lub grami zamkniętymi). W takich grach gracze 
dokonują analizy macierzy gry, następnie wybierają swoje 
strategie optymalne i na tym właściwie gra się kończy. 


Z punktu widzenia teorii gier gry o pełnej informacji są mało 
ciekawe, gdyż ich rozwiązanie jest trywialne (każdy gracz 
stosuje tylko jedną strategię — tzw. strategia czysta). 


W praktyce bardzo rzadko spotykamy się z grami o pełnej 
informacji. Najczęściej gry dwuosobowe nie posiadają 
punktu siodłowego (nazywamy je grami o niepełnej 
informacji lub grami otwartymi). 
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Wyznaczenie strategii gry 


W wielu przypadkach reprezentacja macierzowa jest 
nieprzydatna przy wyznaczaniu strategii optymalnych np. 
gdy nie można zbudować pełnego drzewa gry lub drzewo 
jest znacznych rozmiarów. 


Optymalną strategię można wówczas znaleźć poprzez 
zastosowanie rekurencyjnych funkcji wartościujących 
wierzchołki drzewa gry. 


W drzewie gry wyróżniamy dwa typy wierzchołków: 
> na poziomie gracza 
> na poziomie przeciwnika. 


Na początku funkcje wartościujące przypisane są jedynie 
wierzchołkom końcowym (liściom drzewa). 
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Wyznaczenie strategii gry 


Wierzchołkom na poszczególnych poziomach drzewa gry 
(od liści do korzenia) przypisywane są kolejne wartości 
zgodnie z następującym algorytmem: 


> wierzchołkom na poziomie gracza nadawana jest 
maksymalna wartość potomków 


> wierzchołkom na poziomie przeciwnika nadawana jest 
minimalna wartość potomków 


Powyższy algorytm zakłada, że każdy gracz w kolejnych 
krokach dąży do wybrania jak najlepszego ruchu. 
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Wyznaczenie strategii gry 


Działanie algorytmu ilustruje następujące drzewo gry: 


etap 1 — budowa drzewa gry i ocena wierzchołków końcowych 


Be 


K $ Š J - 
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Wyznaczenie strategii gry 


etap 2 — ocena wierzchołków na poziomie gracza (maksymalna 
wartość potomka) 


KS Да. 
МАХ +10 +2 +6 -6 
iq iq in ip in ip in IE 
+10 -10 +2 -2 +6 +2 -6 -10 
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Wyznaczenie strategii gry 


etap 3 — ocena wierzchołków na poziomie przeciwnika (minimalna 
wartość potomka) 


gp” R 


SX Jo 
z ŚĆ RZE | 
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Wyznaczenie strategii gry 


Ostateczne rozwiązanie: 


MAX Сс.) +2 


MIN Ce Tu 


15, 


/ N ró 
MAX +10 +2 +6 -6 
iq iq in ip in ip in IE 

+10 -10 +2 -2 +6 +2 


-6 -10 
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Wyznaczenie strategii gry 


Twierdzenie minimaksowe 


Fundamentalnym twierdzeniem teorii gier, dotyczącym 
gier dwuosobowych o sumie zerowej, jest twierdzenie 
minimaksowe udowodnione przez von Neumanna (1928): 


Każda skończona gra dwuosobowa o sumie zerowej ma 
co najmniej jedno rozwiązanie, które określa wartość gry 
i optymalne strategie graczy. 
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Wyznaczenie strategii gry 


Strategia minimaksu 


> utwórz drzewo gry o maksymalnej głębokości 


> przypisz wierzchołkom końcowym drzewa (liściom) 
wartości zgodnie z przyjętą funkcją oceny np. +1, -1,0 
(w przypadku dużych drzew użyj funkcji heurystycznej) 

> wierzchołkom na kolejnych poziomach (od liści do 
korzenia) nadaj wartości zgodnie z zasadą: 
maksymalna wartość potomka dla gracza oraz 
minimalna wartość potomka dla przeciwnika 

> po osiągnięciu korzenia wybierz strategię, która 
zapewnia największe zyski 
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Wyznaczenie strategii gry 


Algorytm cięć о-В 


Algorytm cięć a-B stanowi modyfikację algorytmu mini- 
maksowego. W algorytmie tym węzły nie wpływające na 
wartość przypisywaną ich przodkom są eliminowane z 
dalszej analizy (znaczne ograniczenie drzewa gry). 


W algorytmie występują dwa rodzaje cięć: 

> cięcie a - dla wierzchołków na poziomie gracza ocenę 
wierzchołków potomnych można zakończyć, gdy 
wartość będzie niższa niż dotychczasowe maksimum a 


> cięcie В - dla wierzchołków na poziomie przeciwnika 
ocenę wierzchołków potomnych można zakończyć, gdy 
wartość będzie wyższa niż dotychczasowe minimum В 
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Wyznaczenie strategii gry 


Cięcie a: Cięcie В: 
k (max) k (min) 
k+1 (min) k+1 (max) В 


Л\ LIN 


GE (we) ОШО 


jeżeli 1, <= a, to wierzchołków jeżeli f4 >= B, to wierzchołków 
Ws i wg nie musimy rozpatrywać Ws I wę nie musimy rozpatrywać 
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Wyznaczenie strategii gry 


Zastosowanie heurystyki do oceny wierzchołków 


Pomimo pełnej informacji o przebiegu gry i skończonej 
liczbie możliwych ruchów jakie mogą wykonać gracze w 
danej sytuacji utworzenie pełnego drzewa gry i 
wyznaczenie na tej podstawie strategii optymalnych dla 
graczy jest w wielu przypadkach niemożliwe. 


Szacuje się, że w szachach możliwych jest około 10120 
różnych gier. 


Dla gry „kółko I krzyżyk” na 9 polowej planszy liczba 
różnych partii wynosi 9! = 362880. 


W takich przypadkach stosowane jest podejście 
heurystyczne do wyznaczenia optymalnej strategii gry. 
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Wyznaczenie strategii gry 


Aby określić najlepszy ruch w danej sytuacji każdemu 
możliwemu wyborowi przyporządkowuje się pewne 
oszacowanie liczbowe. 


W dowolnym posunięciu należy wybrać tę strategię ruchu, 
której odpowiada największa (lub najmniejsza) wartość 
oszacowania liczbowego. 


Należy dążyć do tego, aby optymalne strategie poszcze- 
gólnych ruchów prowadziły do optymalnej strategii pełnej. 
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Wyznaczenie strategii gry 


Przykład — „kółko i krzyżyk” 


Oznaczmy pola planszy zgodnie z rysunkiem: 


Niech o, (i = 1, 2,... , 9) oznacza funkcję oceny kratki z 
numerem i. Na początku gry przyjmuje się: 

> 09 = З (Środek planszy) 

> 0, = Оз = Os = 05 = 2 (narożniki planszy) 

> O, = 04 = Oş = Ор = 1 (pozostałe pola) 
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Wyznaczenie strategii gry 


Z każdym polem związany jest zestaw kierunków: 


> pole środkowe (9) posiada 4 możliwe kierunki — poziomy, 
pionowy I dwa diagonalne (po przekątnej) 

> pola narożne (1, 3,5, 7) posiadają 3 możliwe kierunki — 
poziomy, pionowy i jeden diagonalny 

> pozostałe pola (2, 4, 6, 8) posiadają 2 możliwe kierunki — 
poziomy i pionowy. 


Kierunek poziomy oznaczamy przez h, pionowy przez v, 
natomiast diagonalny przez d 
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Wyznaczenie strategii gry 


Dla dowolnym kierunku może wytworzyć się jedna z 6 
typowych sytuacji (każdej przypisano ocenę liczbową): 


40 
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Wyznaczenie strategii gry 


Mając tablicę ocen typowych sytuacji na poszczególnych 
kierunkach można wyznaczyć oceny liczbowe dla każdego 
pola w dowolnym momencie gry. Ocenę o, wykonania 
ruchu na pole i obliczmy jako sumę ocen sytuacji na 
wszystkich kierunkach związanych z danym polem. 


Należy określić najlepszy ruch dla gracza С, (stawiającego 
krzyżyk): 


0,=h+v+d=10+5+10=25 
00=h+v=10+0=10 
0,=h+v=10+10=20 
05=h+v+d=20+10+10=40 
0g=h+v=10+5=15 
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Wyznaczenie strategii gry 


Jako podsumowanie: 


Mistrz świata — 2800 punktów 
5 ruchów „do przodu” — 1500 punktów 
dodatkowy poziom — + 200 punktów 
(od 5 do 10) 


Deep Blue analizował 200-1000 milionów pozycji w ciągu sekundy. 


Obecnie, najwyższy ranking w historii wśród szachistów posiada Magnus 
Carlsen (Norwegia) 1 wynosi on 2882 (z roku 2014 - według punktacji ELO 
stosowanej przez Międzynarodową Federację Szachową FIDO do oceny 
relatywnej siły gry szachistów). 

Wśród programów komputerowych na pierwszym miejscu według Szwedzkiej 
listy rankingowej znajduje się Stockfish z wynikiem 3529. 

Według jednego z rankingów który był próbą połączenia i porównania wyników 
uzyskiwanych przez programy szachowe i szachistów najlepszy człowiek zajął 
22 miejsce (na pozycjach 1-50 było tylko 14 szachistów). 
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